فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها




گروه تخصصی











متن کامل


اطلاعات دوره: 
  • سال: 

    1394
  • دوره: 

    23
تعامل: 
  • بازدید: 

    471
  • دانلود: 

    195
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (PDF) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 471

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 195
اطلاعات دوره: 
  • سال: 

    1387
  • دوره: 

    -
  • شماره: 

    2 (پیاپی 10)
  • صفحات: 

    85-104
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1002
  • دانلود: 

    188
چکیده: 

در این مقاله، روش مدل آمیزهی گوسی ساختار یافته (SGMM) که به منظور سرعت بخشی الگوریتم GMM-UBM در سیستم تصدیق هویت گوینده، پیشنهاد شده است، مورد بررسی قرار می گیرد. تاثیر برخی پارامترها در ساخت مدل پس زمینه ساختاری (SBM) به تفصیل مورد بررسی و مقادیر بهینه در ساخت مدل مورد استفاده قرار می گیرد. همچنین برای پردازش امتیازهای خروجی ساختار SBM-SGMM ساختاری با عنوان شناسایی کننده GMM پیشنهاد می شود. شبیه سازی های انجام یافته نشان می دهد ساختار بهینه  SBM در ترکیب با پردازنده امتیازهای پیشنهاد شده، عملکرد بهتری نسبت به سیستم پایه در ترکیب با شبکه عصبی دارد و این در حالتی است که پیچیدگی سیستم پیشنهاد شده، پایین تر از شبکه عصبی می باشد. با استفاده از سیستم پیشنهادی، نرخ سرعت بخشی برابر با 2.7 حاصل گردید و در عین حال عملکرد سیستم نیز نسبت به سیستم  GMM-UBM بهبود نشان می دهد. در بهترین حالت می توان به نرخ خطای برابر معادل 0.35% دست یافت که نسبت به عملکرد سیستم GMM-UBM با نرخ خطای برابر 1.71% بهبود قابل ملاحظه ای حاصل می شود.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1002

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 188 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1387
  • دوره: 

    14
تعامل: 
  • بازدید: 

    476
  • دانلود: 

    206
چکیده: 

برنامه نویسی ژنتیک، از جمله الگوریتم های تکاملی است که توانایی زیادی، نسبت به اغلب روش های یادگیری ماشین دارا می باشد. مشکل این روش، زمان بر بودن اجرای آن است. در این مقاله، هدف استفاده از برنامه نویسی ژنتیک و تطبیق آن به منظور تصدیق هویت گوینده و بررسی هویت کاربران از طریق صدای آنهاست. ایده های متعددی را پیشنهاد نموده ایم تا به کمک آنها بتوانیم ضمن افزایش کارایی روش برنامه نویسی ژنتیک برای تصدیق هویت گوینده، سرعت آموزش مدل های گویندگان را که معمولا در روش برنامه نویسی ژنتیک بسیار زمانبر است را افزایش دهیم. برای این منظور سعی شده است تا با روشهایی چون خوشه بندی به کمک روشهای چندی سازی برداری و نیز با استفاده از توابع گوسی بدست آمده از روش مدل مخلوط گوسی GMM به جای بردارهای ویژگی داده های آموزشی، حجم داده های آموزشی را کاهش دهیم و بدین ترتیب بر سرعت ساخت مدل های حاصل از برنامه نویسی ژنتیک بیافزائیم. نتایج بدست آمده نشان می دهند که استفاده از میانگین های مدل های مخلوط گوسی حاصل از داده های آموزشی گوینده خودی و گویندگان غیرخودی به جای استفاده مستقیم از داده های آموزشی و بطور مشابه استفاده از میانگین های مدل مخلوط گوسی حاصل از داده های آزمایشی، منجر به دقت خوبی در تصدیق هویت گویندگان و نیز افزایش سرعتی در حد 20 برابر (از 5 ساعت به 15 دقیقه) در آموزش مدل های گویندگان به کمک روش برنامه نویسی ژنتیک می گردد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 476

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 206
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1389
  • دوره: 

    8
  • شماره: 

    4
  • صفحات: 

    223-235
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1364
  • دانلود: 

    907
چکیده: 

در تصدیق هویت گوینده، سیستم هویت شخصی را که با سیستم تماس برقرار کرده است، بررسی کرده و تعیین می کند که وی همان شخص مدعی است و یا دروغ می گوید. در این مقاله از برنامه نویسی ژنتیک به عنوان روشی برای مدل سازی گویندگان استفاده شد. با توجه به زمان زیاد آموزش مدل ها توسط برنامه نویسی ژنتیک، ایده بهره مندی از فشرده سازی داده های آموزشی، به منظور کاهش زمان آموزش مدل ها مطرح گردید و بدین ترتیب زمان لازم برای مدل سازی گویندگان با استفاده از برنامه نویسی ژنتیک در حدود 20 برابر کاهش داده شد. آموزش چندین درخت برنامه نویسی ژنتیک به عنوان مدل هر گوینده، ایده دیگری است که به منظور بهبود دقت تصدیق هویت گوینده در این مقاله مطرح شده است. در این روش، داده های آموزشی به تعداد کمی خوشه تفکیک شده و به ازای هر خوشه، یک درخت برنامه نویسی ژنتیک آموزش داده می شود. بدین ترتیب یک گوینده با چندین درخت برنامه نویسی ژنتیک مدل می شود. با استفاده از روش پیشنهادی، کارایی برنامه نویسی ژنتیک برای تصدیق هویت گوینده از 50% به حدود 92% افزایش پیدا کرده است. نتایج حاصل از عملکرد برنامه نویسی ژنتیک با کارایی روش های تمایزی دیگری مثل شبکه های عصبی MLP و LVQ و نیز روش های غیر تمایزی مانند LBG، GMM،GMM-UBM   VQ-MAP ومقایسه گردید و مشاهده شد که برنامه نویسی ژنتیک کارایی بهتری را نسبت به دیگر روش ها نتیجه می دهد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1364

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 907 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نشریه: 

امیرکبیر

اطلاعات دوره: 
  • سال: 

    1381
  • دوره: 

    13
  • شماره: 

    52
  • صفحات: 

    547-565
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1236
  • دانلود: 

    0
چکیده: 

این مقاله به بیان تحقیقات صورت گرفته در راستای طراحی و پیاده سازی یک سیستم تصدیق هویت گوینده از راه دور و از طریق خطوط تلفنی می پردازد. در این سیستم، گوینده هویت خود را توسط یک کد شناسایی 7 رقمی اعلام می نماید. یک الگوریتم بازشناسی ارقام مبتنی بر شبکه عصبی پیشگو که تلفیقی از شبکه عصبی چند لایه پرسپترون و الگوریتم برنامه ریزی پویا می باشد اقدام به بازشناسی ارقام کد شناسایی کاربر می نماید. با اعلام هویت گوینده، مدل مرجع آن گوینده که با استفاده از الگوریتم تلفیقی درخت برآمدگی و الگوریتم ژنتیکی آموزش دیده استخراج و با مقایسه همان گفتار گوینده در بیان کد شناسائی وی با این مدل مرجع، عمل تصدیق هویت صورت می گیرد. در آزمایشات صورت گرفته برای بازشناسی ارقام تاثیر تعداد دفعات ارائه داده های آموزشی به شبکه عصبی، تاثیر برش یا عدم برش خروجی گره ها برای جلوگیری از حالت اشباع، تاثیر تعداد ویژگیها و نوع ویژگی از نقطه نظر ایستا و گذرا بودن و نیز تاثیر ایجاد تغییرات در پارامترهای یادگیری شبکه مورد بررسی قرار گرفت. همچنین طی آزمایشهایی کارایی سیستم تصدیق هویت پیشنهاد شده ارزیابی و روشهای مختلفی برای تعیین سطح آستانه تصمیم گیری مورد بررسی و آزمایش قرار گرفت و نتایج حاصل از بازشناسی ارقام و تصدیق هویت با استفاده از روشهای گفته شده با نتایج حاصل از روش کلاسیک چندی سازی برداری مقایسه گردید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1236

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1386
  • دوره: 

    13
تعامل: 
  • بازدید: 

    315
  • دانلود: 

    103
چکیده: 

استفاده از روشهای کد نمودن اطلاعات گفتاری برای ارسال و استفاده از کاربردهای مختلف به خصوص در عرصه اینترنت، یکی از زمینه های مهم تحقیقات پژوهشگران در زمینه گفتار می باشد. در میان روشهای مختلف تفکیک فعالیتهای شناسایی میان سرویس دهنده و سرویس گیرنده، روش توامان سرویس دهنده – سرویس گیرنده نتایج بهتری را هم در میزان کاهش بار محاسباتی و هم در کاهش نیاز به پهنای باند زیاد به دست می دهد. همچنین استفاده از روش چندی سازی برداری چند مرحله ای یا MSVQ به علت کاهش نرخ بین ارسالی و دقت قابل قبول در کوانتیزه نمودن داده ها یک روش مناسب برای این امر می باشد. با تلفیق توپولوژی سرویس دهنده – سرویس گیرنده و روش MSVQ در بحث بازشناسی گوینده، راندمان های قابل قبولی بدست آمده است. کاهش نرخ بیت ارسالی از حدود 400 بیت بر فریم بر حدود 40 بیت بر فریم نیز از دیگر موارد جالب توجه در این روش می باشد. همچنین با در نظر گرفتن چند مدل بر اساس نویزها و SNR های مختلف برای هر گوینده، فرایند مقاوم سازی سیستم نسبت به نویزهای مختلف با شدت های گوناگون انجام گرفته است که نتایج حاصل نشان دهنده کارایی خوب این روش حتی در مواردی است که نوع نویز داده های آموزش و داده های تست متفاوت هستند.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 315

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 103
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1383
  • دوره: 

    -
  • شماره: 

    16
  • صفحات: 

    33-48
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1284
  • دانلود: 

    132
چکیده: 

در این مقاله یک سیستم کارآمد برای تعیین و تصدیق هویت گوینده معرفی می شود که در برابر نویز و اثر کانال انتقال مقاوم است. با استفاده از تکنیک آمیختن داده ها، دو سیستم HMM و GMM، موازی شده و یک سیستم ترکیبی را برای کاربرد در تعیین و تصدیق هویت گوینده بر روی خط تلفن تشکیل داده‏اند. آزمایشها نشان می‏دهد که مدل ترکیبی HMM+ GMM در بازشناسی گوینده از هر یک از سیستمهای HMM وGMM  بهتر عمل می‏کند. برای مقابله با نویز جمع‏شونده، از روش تفاضل طیفی و نیز از معیارِ تصویر وزن‏دهی شده، و برای جبران‏سازی اثرِ کانالِ تلفن از روش تفاضل میانگین در حوزه کپسترال استفاده شده است که هر سه روش موجب بهبود سیستم بازشناسی گوینده شده‏اند. برای جمعیت 100 نفری گویندگان (61 مرد و 39 زن) و بر روی پایگاه داده تلفنیFARSDIGITS1  با SNR=8.8 dB به ازای داده‏های آزمایشی، نرخ صحت تعیین هویت گوینده برای جمعیت‏ 100 نفری برابر 95.51% و نرخ خطا در تصدیق هویت گوینده 0.37% به دست آمده است. چند روش نرمالیزاسیون امتیازات در سطح گویش و در سطح فریم و نیز روش وزن‏دهی امتیازات مدل برای افزایش کارایی سیستمهای تصدیق و تعیین هویت گوینده به کار رفته و نشان داده شده که این روشها به افزایش تمایز بین گویندگان و در نتیجه کاهش خطا در سیستمهای تصدیق و تعیین هویت گوینده منجر می شوند. بر روی پایگاه داده تلفنی FARSDIGITS1، استفاده از روشهای نرمالیزاسیون امتیازات، کارایی سیستم شناسایی گوینده مبتنی بر مدل مخلوط گاوسی در حالت نرمالیزه نشده را در تعیین و تصدیق هویت گوینده به ترتیب از 95.34% (صحت) و 3.25% (خطا)، به 95.51% (صحت) و 0.33% (خطا) در حالت نرمالیزه شده بهبود می بخشد که بویژه برای تصدیق هویت گوینده این بهبود بسیار چشمگیر است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1284

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 132 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1397
  • دوره: 

    9
  • شماره: 

    4
  • صفحات: 

    441-448
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1017
  • دانلود: 

    208
چکیده: 

در این مقاله، یک الگوریتم استخراج ویژگی مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی-فرکانسی به نام تبدیل شنوایی (AT) و ضرایب کپسترال نرمالیزه شده توان (PNCC)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد می گردد. به طور معمول عملکرد مدل های صوتی که توسط داده های بدون نویز (تمیز) آموزش داده می شوند، وقتی در شرایط نویزی مورد آزمایش قرار می گیرند به طور فزاینده ای کاهش می یابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توان مبتنی بر فیلتر کاکلی (CFPNCC) نامیده می شود تحت چنین شرایطی مقاومت بالایی را از خود بروز می دهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیت های فیلتر بانک کاکلی با مزایای ویژگی PNCC است که مقاومت توام در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. به گونه ای که آزمایش های انجام شده بر روی پایگاه دادگان استاندارد SSC نشان می دهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی PNCC عمل می کند و به طور کلی نسبت به سایر ویژگی های متداول در زمینه تشخیص گوینده مانند MFCC و RASTA-PLP در شرایط نویزی نرخ خطای پایین تری را داراست.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1017

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 208 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1388
  • دوره: 

    15
تعامل: 
  • بازدید: 

    296
  • دانلود: 

    109
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (PDF) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 296

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 109
اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    8
تعامل: 
  • بازدید: 

    364
  • دانلود: 

    210
چکیده: 

گفتار یک پارامتر مناسب برای تشخیص هویت است که علاوه بر کاربرپسند بودن و پیچیدگی پیادهسازی کم، هزینه پایینی هم دارد. با وجود مزایای زیاد، این روش محدودیتهایی نیز دارد که از آن جمله میتوان به کاهش دقت این روش در محیطهای واقعی به دلیل حضور نویزهای مختلف اشاره کرد. تا کنون روشهای گوناگونی برای حل این مشکل در مراحل مختلف سیستم تایید هویت گوینده یعنی استخراج ویژگی، مدلسازی و مقایسه و امتیازدهی ارائه شده است که البته هیچکدام کامل نیست. ...

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 364

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 210
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button